Cos'è test shapiro wilk?
Test di Shapiro-Wilk
Il test di Shapiro-Wilk è un test di verifica di normalità utilizzato in statistica per determinare se un campione di dati è stato estratto da una popolazione normalmente distribuita. È uno dei test di normalità più potenti, soprattutto per campioni di piccole dimensioni.
Quando usarlo:
- Quando è necessario verificare se i dati seguono una distribuzione normale.
- Spesso utilizzato come passo preliminare in molte analisi statistiche che assumono normalità dei dati (es. ANOVA, test t).
- Particolarmente utile quando si hanno campioni di piccole e medie dimensioni (n < 50). Sebbene possa essere usato anche per campioni più grandi, altri test (come il test di Kolmogorov-Smirnov o il test di Lilliefors) possono essere più appropriati per campioni molto ampi.
Ipotesi:
- Ipotesi nulla (H0): I dati sono estratti da una popolazione normalmente distribuita.
- Ipotesi alternativa (H1): I dati non sono estratti da una popolazione normalmente distribuita.
Come funziona:
Il test calcola una statistica di test (W) basata sul confronto tra i quantili del campione e i quantili attesi di una distribuzione normale standard. Il valore di W varia tra 0 e 1, dove valori più vicini a 1 suggeriscono che i dati sono normalmente distribuiti. Più precisamente:
- I dati vengono ordinati in ordine crescente.
- Viene calcolata la statistica W confrontando la covarianza tra i dati ordinati e i loro punteggi normali (i valori attesi se i dati fossero normali).
- Viene calcolato un p-value associato alla statistica W.
Interpretazione del risultato:
- P-value ≤ α (livello di significatività): Si rifiuta l'ipotesi nulla. Ciò significa che ci sono prove sufficienti per concludere che i dati non sono estratti da una popolazione normalmente distribuita. Il valore α è tipicamente impostato a 0.05.
- P-value > α (livello di significatività): Non si rifiuta l'ipotesi nulla. Ciò significa che non ci sono prove sufficienti per concludere che i dati non sono estratti da una popolazione normalmente distribuita. Questo non significa che i dati sono normalmente distribuiti, ma semplicemente che il test non ha trovato prove sufficienti per dimostrare il contrario.
Importante:
- Come tutti i test statistici, il test di Shapiro-Wilk è sensibile alla dimensione del campione. Con campioni molto grandi, anche piccole deviazioni dalla normalità possono portare al rifiuto dell'ipotesi nulla.
- È consigliabile affiancare il test di Shapiro-Wilk con metodi grafici come istogrammi e grafici Q-Q per valutare visivamente la normalità dei dati.
Implementazioni software:
Il test di Shapiro-Wilk è disponibile in molti software statistici, tra cui R, Python (SciPy), SPSS, SAS e MATLAB. Questi software calcolano automaticamente la statistica W e il p-value.